import pandas as pd

df=pd.read_excel(r'D:\doc\电商销售数据08月.xlsx')
head=df.head()#预览前5行数据
print(head)
info=df.info() #字段详细
print(info)
describe=df.describe() #表格统计
print(describe)
df.sort_values(by='销售额',inplace=True) #正序排序
print(df)
df.sort_values(by='销售额',inplace=True,ascending=False) #倒序排序
print(df)
df.sort_values(by=['客户年龄','销售额'],ascending=[False,True],inplace=True) #自定义排序
print(df)
s1=df[(df['客户性别']=='男')&(df['客户年龄']>18)] #数据筛选 与
print(s1)
s2=df[(df['客户性别']=='女')|(df['客户年龄']<18)] #数据筛选 或
print(s2)
s3=df[df['订单号'].isin([1,2,4])] #数据筛选 in
print(s3)
df_split=df['区域'].str.split(pat='-',expand=True) #数据拆分
print(df_split)
df['省份']=df_split.iloc[:,0]
df['城市']=df_split.iloc[:,1]
df['区县']=df_split.iloc[:,2]
print(df)
count=df['订单号'].count() #计数
print('订单数量为{}单'.format(count))
uniCount=len(df['商品品类'].unique()) #去重计数
print('非重复品类订单数量为{}单'.format(uniCount))
sum=df['销售数'].sum() #求和
print('订单销售数总和为{}'.format(sum))
groupByInfo=df.groupby(['商品品类'])['销售数'].sum().reset_index() #分组计数
print(groupByInfo)
